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1 Databases 


Om Power BI te begrijpen is een basiskennis van databases of databanken vereist. Een database kan 
worden gedefinieerd als een gestructureerde verzameling van gegevens. 


Er bestaat databasesoftware in alle soorten en gewichten. Sommige programmas, zoals Microsoft 
Access, zijn bestemd voor relatief kleinschalig gebruik. Een andere categorie is die voor complexe en 
bedrijfskritische toepassingen. Het geheel van programmas dat bestemd is voor het beheer van een 
databank wordt het database management system of DBMS genoemd. 


Niet alleen qua doelgroep, maar ook qua onderliggende architectuur is de databank een vlag die vele 
ladingen dekt. Een bekende categorie in de wereld van databanksystemen is de relationele databank, 
waarbij de data zodanig worden gedefinieerd dat ze op verschillende manieren gereorganiseerd en op- 
gevraagd kunnen worden. Alternatieven voor de relationele database zijn bijvoorbeeld het object- en 
het hiërarchische model of het netwerkmodel'. 


Een relationele databank gebruikt SQL (Structured Query Language) als standaard querytaal om de 


gegevens in de databank te bevragen en aan te passen.” 


2 Relationele database 


Vroeger werden gegevens opgeslagen in ‘platte bestanden’, in het Engels flat files. Dat zijn tekstbe- 
standen waarin gegevens gescheiden door komma's of tabs zijn opgenomen (CSV/TXT). Met behulp 
van een programma (bijvoorbeeld MS Excel) kunnen die gegevens uit het bestand worden gelezen. 
Het programma herkent de komma's of tabs (scheidingstekens) en kan zo gegevens uit het bestand 
selecteren. 


Figuur 1: CSV-bestand 


Barema; Loon 
A1l;1995,82 
A2;2200,92 
A3;2467,63 
B1;2066, 53 
B2;2412,09 
B3;2790,47 
C1;2171,07| 
C23; 2623,18 
C353113,32 
D1;2275,61 
D2;2834, 31 
D3;3436,16 


In een relationele database worden gegevens geordend in tabellen. Een tabel bestaat uit records 
(- rijen) en velden (- kolommen): 


| Zie begrippenlijst. 


2 Zie begrippenlijst. 
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Figuur 2: tabel 


— Record 


Het ontwerp van de database is onafhankelijk van het databasesysteem, zolang je een relationeel da- 
tabasesysteem (RDBMS) gebruikt. 


Om relationele databanken te ontwerpen gebruiken we vaak ER-diagrammen (Entity Relationship 
Diagrams). Een ERD is een soort stroomdiagram dat illustreert hoe tabellen binnen een systeem met 
elkaar verbonden zijn (wat-is-een-entity-relationship-diagram, 2020). 

Een ERD bestaat uit entiteiten, attributen en relaties: 


e Entiteit (- tabel): een entiteit is een object dat bestaat en onderscheidbaar is van andere objecten. 
Voorbeelden hiervan zijn: klanten, contactmomenten en categorieén. 
e Attribuut (~ veld): een entiteit wordt voorgesteld door een verzameling attributen. Mogelijke 


attributen voor de entiteit ‘klant’ zijn bijvoorbeeld klant ID, bedrijf en straat. 


e Relatie: een relatie is een verband tussen verschillende entiteiten. Men kan bijvoorbeeld een relatie 
definiëren die de klant ‘Gramalla S.L. associeert met het contactmoment met ID ‘33’ . Deze relatie 


specificeert dat er een contactmoment geweest is met de klant “Gramalla S.L.. 


Figuur 3: voorbeeld ERD (dit voorbeeld wordt verder uitgewerkt in ‘Ontwerp van een relationele database’) 


meee entiteit — = 
Klant ID Contactmomenten 


Bedrijf Contactmoment_ID 
Voomaam N Klant_ID 


Naam Datum contactmoment 
Straat See ott Duut | Beschrijving 
Postcode Type contact 


Gemeente Categorie contact 


relatie 


We kunnen verschillende ‘soorten relaties’ onderscheiden. We noemen dit de kardinaliteit. De kardi- 
naliteit van de relatie beschrijft het aantal rijen in een tabel dat kan relateren met het aantal rijen in een 
andere tabel. Bijvoorbeeld: een klant kan veel contactmomenten hebben, maar een contactmoment 
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kan bij maximaal één klant behoren. Kardinaliteit wordt meestal uitgedrukt als een-op-een, een-op- 
veel, en veel-op-veel: 
e Een-op-eenrelatie 
Voorbeeld: elke werknemer heeft één bedrijfswagen. 
e Een-op-veelrelatie 
Voorbeeld: één klant kan meerdere contactmomenten hebben, maar een contactmoment is altijd 
gekoppeld aan één klant. 
e _Veel-op-veelrelatie 
Voorbeeld: de tabel Orders bevat orders die zijn geplaatst door meerdere klanten (die vind je in de 
tabel Klanten), en een klant kan meerdere orders plaatsen. In dit geval moeten we werken met een 


‘tussentabel’. 


De kardinaliteit wordt in een ERD als volgt voorgesteld (logisch-model, 2019): 


Figuur 4: notatie kardinaliteit 


elke A heeft 0 of 1 B's 


elke A heeft precies 1 B 


elke A heeft 0 of meer B's 


elke A heeft 1 of meer B's 


2.1 Basisprincipes van databasenormalisatie 


Normalisatie is het proces waarbij de gegevens in een database worden geordend. Concreet betekent 
dit tabellen maken en relaties tussen die tabellen leggen op basis van een aantal regels. 


Elke regel wordt een normaalvorm genoemd. Als aan de eerste regel wordt voldaan, bevindt de da- 
tabase zich in de eerste normaalvorm. Als aan de drie regels wordt voldaan, bevindt de database zich 
in de derde normaalvorm. Hoe hoger de normaalvorm, hoe meer eisen er gesteld worden aan het 
ontwerp. De vijfde normaalvorm is de hoogste. Wanneer aan geen van de regels voldaan is, wordt dat 
aangeduid met ONE In praktijk betekent dit dat de database niet goed ontworpen is en vaak beperkt 
bruikbaar. 


De meeste toepassingen gebruiken databases die zijn genormaliseerd tot de eerste, tweede of derde 


normaalvorm. 
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Eerste normaalvorm (1NF) 


De regels van de eerste normaalvorm zijn: 


e Elk attribuut bevat één waarde. Zo maken we bijvoorbeeld aparte attributen voor straatnaam, 


postcode, gemeente. 


e Geen enkel attribuut wordt herhaald. 


Kortom, als alle data in een of meer tabellen zijn ondergebracht, is er al sprake van de eerste 


normaalvorm. 


Tweede normaalvorm (2NF) 


De regels van de tweede normaalvorm zijn: 
e De database voldoet aan de regels van de eerste normaalvorm. 


e Repeterende attributen worden opgenomen in een aparte tabel. 


Derde normaalvorm (3NF) 


De regels van de derde normaalvorm zijn: 
e De database voldoet aan de regels van de tweede normaalvorm. 


e Alle velden die niet tot een sleutel behoren, hangen niet af van een ander, niet-sleutelveld. 


2.2 Ontwerp van een relationele database © 


Situatieschets 


Tex-Mex bv wil een database om contactmomenten met de klant op te slaan. Klantgegevens zijn bij- 
voorbeeld voornaam, naam en straat. Elke keer dat het bedrijf en een klant met elkaar communiceren, 
wordt beschouwd als een contactmoment. 

We starten met het maken van een tabel. We houden daarbij rekening met de normalisatieregels en 


maken een attribuut voor iedere waarde (INF). 


Figuur 5: database contactmomenten 


Klantnr Bf Bedrijf ba Voornaam hd Naam Bd Straat Bd Postcode hd Gemeente _ hd Datum contahd Type contact hd Beschrijving Bd Categorie contact Md 
KO001 Gramalla S.L. Isabelle Urgel ‚C/ Esteve Dolsa Pujal 7 AD701 ‚Andorra La Vella 5/07/2019 Telefoon Beschadiging verpakking Klacht 

KO001 ‚Gramalla S.L. Isabelle Urgel ‚C/ Esteve Dolsa Pujal 7 AD701 Andorra La Vella | 5/09/2019|Mail | Inieuwe bestelling Bestelling 

K0002 _Agilaty Gmbh Hans Andenberg Alpenstrasse 14 1339 Wien 16/10/2019 Telefoon Levertermijn _ Informatieaanvraag 
KO002 Agilaty Gmbh Hans Andenberg Alpenstrasse 14 7339 Wien 1/12/2019 Contactformulier Openingsuren Informatieaanvraag 


Onze database voldoet aan de eerste normaalvorm. Maar het adres van de klant moet bij ieder con- 
tactmoment weer ingevoerd worden, waardoor één adres wellicht honderden keren in de database 
voorkomt. De structuur kan dus beter. 


Om te voorkomen dat de klantgegevens meerdere keren ingevoerd of gewijzied moeten worden, 
Om t k dat de klantgeg dere k g d of gewijzigd t d 
plaatsen we deze in een aparte tabel (2NF). In de tabel met de contactmomenten komt een verwijzing 


naar de klant (Klant_ID). 
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Figuur 6: tweede normaalvorm 


al =| |= dl St = À +| | 7 i = 7 - ' = i 
KOOL Gramalla S.L. Isabelle Urgel C/ Esteve Dolsa Fujal? AD701 Andorra La Vella 5/07/2019 Telefoon Beschadiging verpakking Klacht 
KOOL Gramalla 5.1. Isabelle Urgel C/ Esteve Dolsa Pujal 7 AD70I Andorra La Vella 5/05/2019 Mail Mieuwe bestelling Bestelling 
KOOD2 Agilaty Gmbh Hans Andenberg Alpenstrasse 14 1339 Wien 16/10/2019 Telefoon Levertermijn Informatieaanvraag 
KogO? Agilaty Gmbh Hans Andenterg Alpenstrasse 14 1339 Wien 1/12/2019 Contactformulier Openingsuren informalieaarmraag 4 
Klant Contactmoment 
¥ | | Lw fa St ¥ | i lw ¥ ¥ z 
KOOO1 Gramalla S.L. Isabelle Urgel C/ Esteve Dolsa Pujal? AD?O1 Andorra La Vella 1 Kooni 5/07/2019 Telefoon Beschadiging verpakking Klacht 
KOOOF Agilaty Gmbh Hans Andenberg Alpensirasse 14 1339 Wien a 2 KO001 5/09/2019 Mail Nieuwe bestelling Bestelling 
3 KOOOZ 16/10/2019 Telefoon Levertermijn informatieaarvdraag 
4 kogt 1/12/2019 Contactformulier Openingsuren Informatieaanvraag g 


Het ER-diagram ziet er als volgt uit: 


Figuur 7: ER-diagram 


Klant_ID i | = Contactmomenten 


Bednif Contactmoment_!D 
Voomaam a = Klant_ID 

Naam Datum contactmoment | 

straat Beschrijving 
Postcode Type contact 
Gemeente Categorie contact | 


ledere entiteit heeft een sleutel of een uniek record om de records te identificeren en de gegevens in 
de verschillende tabellen aan elkaar te koppelen: 


e Tabel Klanten: Klant ID (primaire sleutel) 
e Tabel Contactmomenten: Contactmoment ID (primaire sleutel) 


e ‘Tabel Contactmomenten: Klant ID (vreemde sleutel) 


Primaire en vreemde sleutels 


Een primaire sleutel is een attribuut dat aan de volgende voorwaarden voldoet: 

e uniek, 

e niet leeg, 

e legt relaties tussen tabellen. 

Een vreemde sleutel of een verwijzende sleutel is een attribuut in een tabel dat dient als verwijzing naar 


een andere tabel. Een vreemde sleutel bevat dus uitsluitend waarden van de primaire sleutel van die andere 
tabel. 


In het voorbeeld hebben we een een-op-veelrelatie gelegd tussen de entiteit Klanten en de entiteit 
Contactmomenten op basis van het gemeenschappelijke attribuut Klant ID. 


Onze database voldoet tot nu toe aan de tweede normaalvorm. 
We gaan een stap verder en kijken naar de derde normaalvorm. Bij de tweede normaalvorm gaan we 


er nog van uit dat de gemeente en de postcode attributen zijn van de klant. In de derde normaalvorm 
worden de postcode en de gemeente als aparte entiteiten gezien. 
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Figuur 8: derde normaalvorm 


Klant 

Klant ID d Bedrijf EA Voornaam M Naam M Straat MA Postcode BA Gemeente KJ 

K0001 Gramala S.L. Isabele Urgel C/ Esteve Dolsa Pujal 7 701 Andorra La Vella 

K0002 Agiaty Gmbh Hans Andenberg Alpenstrasse 14 1339 Wien d 

Klant 

Klant ‘EX Bedrijf E Voornaam BA Naam E Straat ___E | Postcode If E Gemeente [z] 
KO001 Gramala S.L. Isabelle Urgel C/ Esteve Dolsa Pujal7 | Andorra La Vella 

KO002 Agilaty Gmbh Hans Andenberg Alpenstrasse 14 Wien M 


Ook voor de categorie waartoe het contact behoort en het type contact maken we nieuwe entiteiten. 


Figuur 9: derde normaalvorm 


Contactmoment 


if Tis C Tua z 
= [Ray eee ey = 
| contactm YM 


nt ID BA Klant 1D 


a Et. - A ad ~ z nwr. Sa ana ge ban me r i 
Bd Datum contactmoment È contactt E 


a eee 
hd seschri LLU! S m 


Ca El rie intact is 
| 1 K0001 5/07/2015 1 Beschadiging verpakking 
| 2 K0001 5/09/2019 2 Nieuwe bestelling ie 
| 3 K0002 16/10/2019 1 Levertermijn 
4 KODE 1/12/2014 3 Ppeningsuren | 2 


Type contact | 


lee 


=t 


Categorie contact | 


Het ERD in de derde normaalvorm ziet er als volgt uit: 


Figuur 10: ERD 


Klant_ID 
Bedrijf 


Voornaam 


Naam 
Straat 
Postcode _ID 


Postcode _ID 
Postcode 


Gemeente 


| Contactmomenten | 


Contactmoment_ID 


Contacttype_ID 
Type contact 


Klant_ID 
| Datum contactmoment | 


Beschrijving | 
Contact_ID 3 —— 
Categorie_ID 3 


Categorie_ID 


Categone 


Onze database voldoet nu aan de derde normaalvorm. In het voorbeeld is geen enkel niet-sleutelat- 
tribuut nog afhankelijk van een ander niet-sleutelattribuut. 

Voordeel: de data zijn niet meer redundant (overtollig) opgeslagen en de structuur van de data is 
meteen duidelijk, ook wanneer men de data zelf nog niet kent. 
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3 Relationeel model in Power BI 


Met de Modelweergave in Power BI kun je heel complexe gegevenssets met meer dan honderd 


tabellen bekijken en gebruiken. 


Gegevens modelleren is de derde stap in de data-ijsberg: 


Ed 


DATA IJSBERG 


— 


| Es Aieualiseren 
Analyseren 
Modelleren 
Opschonen 


Importeren 


Dit hoofdstuk bouwt verder op het hoofdstuk “Gegevens opschonen en transformeren met Power Query 
Editor’. Je kunt dus verder werken in het bestand H4 Gegevensanalyse_ Tex-Mex.pbix. Als je dat hoofd- 


stuk nog niet hebt afgewerkt, vind je het bestand ook in de lijst met opgavebestanden onder de naam 


H15_Gegevensanalyse_ Tex-Mex. pbix. 


1 Open het bestand H5_Gegevensanalyse_Tex-Mex_opgave (of je eigen oplossing) van hoofdstuk 4 in 
Power BI Desktop. Indien je verder werkt in je eigen oplossing moet je mogelijk nog (opnieuw) 
verbinding maken met de map Orders: 


e Klik in het lint op Home > Get Data > More > Folder. 
e Navigeer naar de map Orders. 

e Klik op Combine > Combine & Load. 

e Klik op OK. 


2 Klik in het linkerdeelvenster op het pictogram Model. In de modelweergave worden alle tabellen, 
kolommen en relaties in je model weergegeven. 


Je herkent onmiddellijk een ER-diagram! 
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Figuur 11: modelweergave 


= HS Gegevensanalyse_Tex-Mex - Power Bl Desktop p Search Kelly Decroock "A 


my Home Help a | 
ela ts bee PR A Als Al A ah 


Get Excel PowerBl SOL Enter Dataverse Recent Transform Refresh Manage Manage View Q&A Language Linguistic Publish 
data = datasets Server data SOUICES + data + relationships roles as setup “ schemas 
Clipboard Data Queries Relationships Security EA Share En 
al j | Froperties > Fields > 
[Z] iPr T + EB] Herh 7 
a | EN: men O Searc 

EE RTE Bast A Cards Loe arch 
58 Show the database in the header when > FB Klachten 

— applicable ; 

Ai lin TE] haram i 5 > EB Klanten 

i : No Q— = - 

: | . > BB Orders 


i > BB Personeelsleden 
Show related fields when card is collapsed 


> Producten 


Yes ——@® 


Pin related fields to top of card 


No O— 


All tables 


a Het lint in de gegevensweergave bestaat uit drie tabbladen: File (Bestand), Home en Help. 
In het linkerdeelvenster kun je schakelen tussen de Report View (Rapportweergave), de 
© Data View (Gegevensweergave) en de Model View (Modelweergave). Dat doe je door © 
S S 5a J 
de pictogrammen te selecteren. 
c In het middelste deelvenster kun je de relaties tussen de verschillende tabellen zien. 


d In het deelvenster Properties (Eigenschappen) kun je algemene eigenschappen van één 
of meerdere tabellen instellen. Je kunt meerdere tabellen tegelijk selecteren met de 


CTRL-toets. 


e In het deelvenster Fields kun je mappen aanmaken om complexe modellen beter leesbaar 


te maken. 


De deelvensters Properties en Fields kunnen dichtgeklapt worden (>). 
f Je kunt extra tabbladen toevoegen met een subset van de tabellen die je model bevat. 


g Met de schuifregelaar kun je op het middelste deelvenster in- of uitzoomen. 


3.1 Autodetectie tijdens het laden 


Tijdens het laden van de gegevens heeft Power Bl automatisch relaties tussen de tabellen gedetecteerd 
(functie Autodetect). In de meeste gevallen hoef je niets meer te doen, maar in sommige gevallen is het 
nodig om relaties te wijzigen of nieuwe relaties te leggen die Power BI niet automatisch gedetecteerd 
heeft. Hoe dan ook is het belangrijk om relaties in Power BI te begrijpen en te weten hoe je ze maakt 


en bewerkt. 
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Power BI Desktop kijkt naar kolomnamen van de tabellen die je laadt en het gegevenstype om te 
bepalen of er mogelijke relaties zijn. Als dat het geval is, worden de relaties automatisch gemaakt. Als 
Power BI Desktop niet met grote zekerheid kan vaststellen of er een overeenkomst is, wordt er niet 
automatisch een relatie gemaakt. 


Notitie 


Als er een relatie bestaat tussen twee tabellen, kun je in beide tabellen met de gegevens werken alsof ze één 


tabel vormen. Je hoeft dan in principe geen tabellen samen te voegen tot één tabel voor je ze importeert. 


3.2 Actieve en niet-actieve relaties 


Wanneer Power BI Desktop automatisch relaties maakt, wordt er soms meer dan één relatie tussen 
twee tabellen gedetecteerd. In een dergelijk geval wordt maar een van de relaties als actief inge- 
steld. De actieve relatie fungeert als de standaardrelatie. De niet-actieve relatie wordt aangeduid in 


stippellijn. 


1 Open het bestand 15-Gegevensanalyse_Tex-Mex-opgave.pbix (of je eigen oplossing) in Power BI 
Desktop. 


2 Klik in het lint op Home > Manage relationships (Relaties beheren) om een overzicht te krijgen van © 


de automatisch gedetecteerde relaties. 


Figuur 12: dialoogvenster Manage relationships 


Manage relationships 


Active From: Table (Column) To: Table (Column) 
J Klachten (Klant_ID) Klanten (Klant_ID) 
C Klanten (Personeelslid_1D) Personeelsleden (Personeelslid_ID) 
v Orders (Productnr) Producten (Productnr) 
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3.3 Relaties verwijderen 
Selecteer de relatie die je wilt verwijderen en klik op Delete. 


Figuur 13: relatie verwijderen 


o) 


Personeelsleden 


> Personeelslid_ID 
Adres 
Afdeling 


E-mailadres Klanten 


Functie 


o) 


Klant_ID 
Personeelslid_|D 


Gemeente 


Geslacht wv 


Naam_personeelslid Adres 
Postcode | Redriifsnaam 
' Delete me 
Collapse “* Dr zeen | 
Fax 
Geslacht 
Klantnaam 
Collapse ^ 


3.4 Relaties toevoegen 
Relaties toevoegen kan op twee verschillende manieren. 


Om het aantal orders per verkoper te kunnen visualiseren, leggen we een relatie tussen de tabel 
Personeelsleden (veld Personeelslid_ID) en de tabel Orders (veld Verkoper). 


Eerste manier 


1 Klik op het plusteken om een extra tabblad toe te voegen. 


Figuur 14: tabblad toevoegen 


GERE 


All tables ei 


2 Sleep de tabellen Personeelsleden en Orders uit het deelvenster Fields naar het middelste deelvenster. 
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Figuur 15: tabellen slepen 


File Hame Helo 
< il Ì TT 
mla O8 LOE LO 
Get Excel Power BI SOL Enter Dataverse Recent 
dat ver data SOEs = 


datasets Ser 


Clipboard Dals ii 
si s 
lzi £ Fields > 
EEE D Sear 
= 
SS - i » BB Klachten 
—— —~ 
Personeelsleden 2 EB anten 
i > E Orders 
> BB Personeelsleden 
= > FB Producten 
Orders 
EE) Bestel 
Productnr 
R 
ED Verzenddatum Li 
>. Bestel 
Klar 
Postcode 
> Pale 
SoH 
> Werk 
All tables layout 1 Layout 2 + 
I + Ea 


3 Sleep het veld Personeelslid_ID naar het veld Verkoper. 


Figuur 16: relatie toevoegen 


Personeelsleden fe : 
Adres 
Afdeling 
E-mailadres Orders 
Functie —_ 
i} Besteldatum 
Gemeente 
Productnr 
Geslacht 
, HH Verzenddatum 
Naam_personeelslid 
i Bestelnr 
> Personeelslid_!D 
—_—— — Klantnr 
Postcode 
> Paletten 


Collapse ^ 


ee 


> Personeeltsli “ee 


li 
Collapse “™ 


Tweede manier 


1 Selecteer de tabel Personeelsleden en klik in het lint op Home > Manage Relationships. 
2 Kies New. Het dialoogvenster Create relationship verschijnt. 


3 Selecteer in de eerste keuzelijst een tabel (Personeelsleden) en selecteer vervolgens de kolom die je 
in de relatie wilt gebruiken (Personeelslid ID). 


4 Selecteer in de tweede keuzelijst de andere gewenste tabel voor de relatie (Orders); selecteer vervol- 


gens de andere kolom die je wilt gebruiken (Verkoper). 
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Figuur 17: relatie toevoegen 


Create relationship 


Select tables and columns that are related. È 

Personeelsleden ” 

Personeelslid ID Geslacht Adres E-mailadres Naam_ personeelslid Scholingsgraad Po: 
62040633539 M Schapendreef 88 vjanssens@texmex.com Vincent Janssens MG B-8 
63031380156 M Paalstraat 8 nsimon@texmex.com Nathan Simon LG B-8 
64102206906 M Garenmarkt 5 lbourgois@texmex.com Lieven Bourgois LG B-8 

< > 

Orders X 

Source.Name Bestelnr Besteldatum Verzenddatum Verkoper Klantnr Productnr 

Orders 1017.csv 2017116 maandag 2 oktober 2017 dinsdag 17 oktober 2017 64012914050 K0113 200104 

Orders_1017.csv 2017116 maandag 2 oktober 2017 dinsdag 31 oktober 2017 64012914050 K0113 200105 

Orders _1017.csv 2017116 maandag 2 oktober 2017 zaterdag 14 oktober 2017 64012914050 KO113 200106 

< > 

Cardinality Cross filter direction 

One to many (1:*) ~ Single ai 
¥ Make this relationship active Apply security filter in both directions 
Assume referential integrity 


5 Klik op OK en sluit het venster Manage relationships. 


Notitie 
Om een relatie te leggen moet ten minste één tabel in de relatie een kolom hebben met unieke sleutelwaarden. 


Dit is een algemene vereiste voor alle relationele databases. 


6 Verberg de kolommen die niet zichtbaar mogen zijn in de rapportweergave. Klik in de tabel Orders 
op het oogje naast het veld Source. Name. 
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Figuur 18: verbergen in de rapportweergave 


Orders © : 


Besteldatum 
Productnr 
Verkoper 

d Verzenddatum 
> Bestelnr 
Klantnr 


>. Paletten | 
This field or table is visible in report view. Select to 
hide it. 
Collapse ^ me 


Source.Name 


Tabellen of kolommen verbergen 


Wanneer je een tabel of kolom verbergt, wordt die niet uit het model verwijderd. Het verbergen van tabel- 
len of kolommen 1s alleen bedoeld om de lyst met tabellen en kolommen die zichtbaar zijn voor de eindge- 


bruiker (in de rapportweergave) te vereenvoudigen. 


3.5 Feiten en dimensies 


Om het gegevensmodel volledig te begrijpen voor we starten met berekende kolommen en metin- 
gen in het hoofdstuk over berekeningen en gegevensanalyse met DAX, verwijderen we alle automa- 
tisch gedetecteerde relaties en voegen we de relaties opnieuw manueel toe. We verwijderen ook de 
tabellen die we niet nodig hebben voor onze analyse. 


Een gegevensmodel bestaat uit tabellen met feiten en tabellen met dimensies. Feiten kunnen ge- 
groepeerd worden (bijvoorbeeld volgens omzet of hoeveelheid). Dimensies geven betekenis aan de 
feiten (bijvoorbeeld jaren of categorieën). Een hulpmiddel om het verschil te weten tussen feiten en 
dimensies is het woordje ‘per’. Elke keer dat je ‘per’ zegt, heb je het over een extra dimensie. Als je 
het ‘ziekteverzuim per medewerker per maand’ wilt weten, dan beschouw je het ziekteverzuim als de 
feiten. De medewerker en maand zijn dimensies. Als je de de ‘omzet per land per smaak’ wilt weten, 
dan beschouw je de omzet als de feiten, de dimensies zijn land en sector. 


In een gegevensmodel staat de feitentabel centraal, met daarrond meestal meerdere dimensietabellen. 
Een feitentabel bevat sleutelkolommen voor dimensies die betrekking hebben op dimensietabellen, 
en kolommen met numerieke meetwaarden. 
Over het algemeen bevatten dimensietabellen een relatief klein aantal rijen. Feitentabellen kunnen 
daarentegen een groot aantal rijen bevatten. 


Het model krijgt de vorm van een ster, zodat we van het sterschema spreken. 
Een sterschema is een volwaardige modelleringsmethode die op grote schaal wordt gebruikt door 


relationele datawarehouses (star-schema, 2020). 
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Figuur 19: sterschema 


We passen dit toe in ons voorbeeld. 


1 Klik in de modelweergave in het lint op Home > Manage relationships. 


2 Verwijder alle relaties: 


a Selecteer alle relaties met de SHIF T-toets. 
b Klik op Delete. 
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Figuur 20: relaties verwijderen 


Manage relationships 


Active From: Table (Column) 
v Klachten (Klant_!D) 
v Orders (Productnr) 
v Orders (Verkoper) 


Delete 


c Bevestig door te klikken op Delete. 
d Klik op Close. 


3 Klik in het tabblad AZ tables op Reset layout. 


Figuur 21: reset layout 


HS Gegevensanalse Tex-Mex - Power Bl Desktop 
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To: Table (Column) 
Klanten (Klant _ID) 
Producten (Productnr) 


Personeelsleden (Personeelslid_ID) 


Close 


File Home Help 


ela de HIG R 


Fuste 42) Get Excel Power@l SOL Enter Dataverse Recent 


PD a 


Transform Refresh Manage Manage View 
data datasets Server data Sources + data relationships roles 
Clipboard Data Queries Relationships Security 

ii 

B CE] Mschsen ‘ [E] armen [E] Fersonseiskeden 
| T ats ii j m la ars 

ae $ r i n Te er 
f Ort df Urn aen 


All tables Layout 1 Layout 2 + 
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awe: 


ak AIA 


O&A Language Linguistic Publish 
ae schema 


ORA Shae 


[ea] Produceren F [E] Orders 
eta ht C Genie 


as, 


salados 


Fields > 
| Ø Search | 


> FB Klachten 
> EB Klanten 
v E Orders 
Besteldatum 
> Bestelnr 
Klantnr 
> Paletten 
> Productnr 
Source. Name iy 
De Verkoper 
Verzenddatum 
> BH Personeelsleden 


> FS Producten 
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In een volgende stap controleren we welke tabel(len) de feiten bevatten en welke tabel(len) de 
dimensies: 


Feitentabel (len) Dimensietabel (len) 


Personeelsleden 
A O 


1 Plaats de feitentabel centraal en leg de volgende relaties door de velden te slepen. 


Figuur 22: relaties 


Manage relationships 


Active From: Table (Column) To: Table (Column) 
v Klachten (Klant_ID) Klanten (Klant_ID) 
v Orders (Klantnr) Klanten (Klant_ID) 
v Orders (Productnr) Producten (Productnr) 
v Orders (Verkoper) Personeelsleden (Personeelslid_ID) 


Figuur 23: sterschema 


Personeels 
-leden 


Producten Klanten 
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Een modelontwerp met een goede structuur bevat tabellen die ofwel dimensietabellen of feitentabel- 


len zijn. 


Het ontwerpen van een optimaal model is echter geen exacte wetenschap. Soms moet je de teugels wat 


loslaten als dit het meest logisch lijkt. 


In het voorbeeld is de tabel Klachten geen zuivere feiten- of dimensietabel. De tabel Klanten filtert de 
tabel Klachten (we willen het aantal klachten per klant visualiseren). 


Figuur 24: model Tex-Mex 


Klachten 


Datum afhandeling kiacht 


Datum indienen klacht 


Klant 1D 


Categorie klacht 


/. Kach iD 


Omschrijving dacht 


2. Personeelslid_ ID 


Prioriteit 


Status klacht 


1 
Klanten 


Mant! 
Acres 
Bedrijfsnaam 


ST Werumemer 


gD ok 


re : 


Orders 


EH Besteldatum 


mm, 
= 


2 
2 


=. 
ae A 


Klantnr 
Productnr 


Verkoger 


| Verzenddatum 


Bestelnr 
Paletten 


Source. Mame 


apse 


D 


Personeelsleden 


Sersoneeislid_|D 
Adres 

Afdeling 
=-mailadres 
Functie 
Gemeente 
Geslacht 


Naam personeelslid 


Collapse “^ 


Producten 


Preductnr 
Aantal/karton 
Gewicht 
kartons Pallet 
Productnaam 
Smaak 

Type 

VE Pak 


= 
alls 
w EE 


2 Bewaar het bestand onder de naam H5_Gegevensanalyse_Tex-Mex.pbix. 


Notitie 


Het is aan te raden in de naamgeving van de tabellen de prefix Dim (dimensietabel) of Fact (feitentabel) te 


gebruiken. Dit kan helpen bij het modelleren. 


Bij het leggen van relatie moeten we lussen vermijden. Als er bijvoorbeeld nog een relatie gelegd zou 
worden tussen de tabel Klachten (kolom Personeelslid ID) en de tabel Personeelsleden (kolom Personeelslid_ID), ont- 


staat er een lus. 


Een alternatief voor het sterschema is het snowflake scheme of sneeuwvlokschema. Daarbij worden de 


dimensietabellen verder genormaliseerd. 
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fm, i 


Het gegevensmodel begrijpen is cruciaal om tot een correcte gegevensanalyse te komen. 
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3.6 Kardinaliteit en kruisfilterrichting 


Wanneer je een relatie maakt of bewerkt, kun je in Power BI extra opties configureren: de kardinaliteit 
(Cardinality, zie ook Relationele database) en de kruisfilterrichting (Cross filter direction). 


Figuur 25: opties relaties 


Cardinality Cross filter direction 
One to many (1:*) ~ | Single 
w Make this relationship active Apply secunty filter in both directions 


Assume referential integrity 


Power BI configureert automatisch de eigenschappen voor kardinaliteit en kruisfilterrichting. Maar je 
kunt ze wijzigen wanneer je dat nodig vindt. 


Kardinaliteit 


We onderscheiden vier soorten kardinaliteit: 


Figuur 26: kardinaliteit 


Cardinality 
Many to one (*:1) v 
Many to one (*:1) 
One to one (1:1) 


One to many (1:*) 


Many to Many (*:*) 


One to many of een-op-veel (1:*), of omgekeerd (*:1) 


Dit type relatie komt heel vaak voor. Eén record in de eerste tabel is gerelateerd aan meerdere records 
in de tweede tabel. Voor elke klant (1) kunnen bijvoorbeeld meerdere (veel) orders opgeslagen zijn. 
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Figuur 27: een-op-veelrelatie 


| Klant ID |-7) Bedrijfsnaam |~ | Klantnaam | “| Klantvoornaam | ~ || 
K0001 Gramalla $.L. Urgel Isabelle 
K0002 AEAN IR tb Andenberg Hans 
| Anitolien Production Briesmann Aaron 
Kip Warenhandel Ag Ellerman Ahmed 


uree. Name [~] Bestelnr [=] Besteldatum | Verzenddatum [+] Verkoper [~] Klantnr Ej Productnr [~] Paletten [ 
ders_0218.csv 2015026 _ vrijdag 23 februari 2018 zondag 18 maart 2018 64012914050 | K0002 450103 i 
ders 0218 csv 2015026 vrijdog 23 februari 2015 foterdeg 24 maart 2018 64012914050] K0002 450103 i 
ders_0216.csv 2018026 vrijdog 23 februari 2018 woensdag 21 moort 2018 6(**““*7050) KOOO2 #50102 i 
ders _0218.csv 2015026 vrijdag 23 februori 2018 moandog 5 moort 2018 € koso | KO002 450101 i 
ders 0218c 2015026 vrijdog 23 februeri 2018 woensdeg 21 moort 2018 | 6401 2914050 KO002 450100 i 
ders_0218.csv 2018018 woensdog 7 februcri 2018 woensdeg 7 mocrt 2018 64012914050] KOOO2 200107 ! 
ders_0218.csv 2018018 woensdag 7 februari 2018 vrijdog 2 maart 2018 62012912050] KOOO2 200100 

ders_O218.csv 2015018 woensdog 7 februari 2018 vrijdog S maart 2015 64012914050] KOOO2 450107 

ders_0218.csv 2015018  woensdog 7februeri 2018 woensdag 14 februari 2018 64012914050] KOOO2 450106 : 
ders_0218.csv 2018018 woensdog 7februcri 2018, woensdag 21 februari 2018 64012914050] KOOO2 450105 í. 
ders O218.csv 2015018 woensdog 7 februari 2018 dinsdog 27 februari 2018 64012914050] KOOO2 450104 

ders_0218.csv 2015018! woensdeg 7februcri20l8 woensdog 21 februari 2018 64012914050] KOOO2 450103 

ders_0218.csv 2015018  woensdog 7 februari 2015 donderdeg Imoort 2018 660129140350] KOOO2 450102 
ders_0218.csv 2018018 woensdog 7 februari 2018 maandag 26 februari 2018 64012914050] KOOO2 450101 N 
ders_0218.csv 2015018 woensdag 7 februari 2018 dinsdog 27 februari 2018 64012314050 | k0002 450100 1. 
ders O217.csv 117020 vrijdeg 10 februeri 2017 woensdag 8 moort 2017 64012914050] KOOO2 125103 


One to one of een-op-een (1:1) 


Eén record in de eerste tabel is gerelateerd aan één record in de tweede tabel. Een personeelslid (1) 
uit de tabel Personeelsleden is bijvoorbeeld gerelateerd aan één wagen (1) uit de tabel Bedrijfswagens. 


Many to many of veel-op-veel (*:*) 


Meerdere records in een tabel zijn gekoppeld met meerdere records in een andere tabel. Tussen klanten 
en product bestaat er bijvoorbeeld een veel-op-veelrelatie. Klanten kunnen meerdere producten kopen 
en één product kan door meerdere klanten worden gekocht. 

In dit geval kan er gewerkt worden met een samenvoegtabel, of de veel-op-veelrelatie wordt gesplitst 
in twee een-op-veelrelaties. Elke record in een samenvoegtabel bevat een vergelijkingsveld met de 
waarde van de primaire sleutels van de twee tabellen die worden samengevoegd. 


Figuur 28: veel-op-veelrelatie 


= | N Producten C 
Klanten Ch Ordèrs EN 
Productnr 
KlantID E| Besteldatum 
. Aantal Karten 
Adres “lantnr ER 
Gewicht 
Bedrijfsnaam Draductar 4 
* i Kartons/Pallet 
BTW-nummer | Verkoper rl 
zen * J Productnaam 
Emailadres 1 Verzenddatum 
Smaak 
Fax > Bestelnr 
z Type 
Geslacht > p 
i aletten 
VP/Pak 
Klantnaam Source. Name NE 
| Collapse “> 
Klantvoornaam Ei x il 
Collapse “ * 


Collapse ~ 
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Kruisfilterrichting 


De richting van de relatie speelt een hele belangrijke rol bij het modelleren in Power BI. Concreet 
betekent dit dat de tabel Producten of de tabel Klanten de tabel Orders kan filteren. 


Figuur 29: richting relatie 


jii | mis 3 N l Producten a 
Klanten oY: 3 inder a: 
Productnr 
Klant_ {0 Besteldstum 
z bi Aantal Karton 
Agres 


klantnr En 
Wewient 

Bedrijfsnaam Produc 
f POLET 


Bhar. i ~— -x 
BTW-nummer Verkoper 
Emailadres 1 | FE] Verzenddatum 


Kartens,/ Pallet 


Productnaam 


i Smaak 

Fax > Bestelnr 

= j 5 Type 

„t| aF AF 

GERECHT 2 Paletten WO 
VP/Bak 

Klantnaam Source. Name he 

KI Collapse 

Klantvoornaam i 


Collapse ~ 


Collapse “* 


1 Klik op het pictogram Report om naar de rapportweergave te gaan. 


2 Selecteer in het deelvenster Fields in de tabel Producten het veld Smaak en in de tabel Orders het ® 
veld Palletten. Het resultaat is het aantal palletten per smaak. 


Figuur 30: aantal palletten per smaak 


Smaak Paletten 
Barbecue 21367 
Cheese 20334 
Lightiy Salted 20244 
Salted 19585 
Chili 19161 
Salsa 19002 
Guacamole 18368 
Burrito 17702 
Total 155763 


Door de filterrichting kan de tabel Orders gefilterd worden door een dimensie uit de tabel Producten. 
Stel dat we het aantal klanten per smaak willen visualiseren: 


1 Selecteer in het deelvenster Fields in de tabel Producten het veld Smaak en in de tabel Klanten het 
veld KlantID. 
2 Kies voor het veld KlantID de aggregatie Count (Distinct). 
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Figuur 31: Count (Distinct) 


3 Hoewel de tabellen gerelateerd zijn (met een tussentabel), krijgen we niet het juiste resultaat. 


Figuur 32: aantal klanten per smaak 


EIERNE 


ira 


Smaak 
Klant_ID 


Remove field 
Rename 


Move 


Conditional formatting 


Remove conditional formatting 


v” Don't summanze 


First 
Last 


Count 


‘Count (Distinct) 


New quick measure 


Show items with no data 


New group 
| 


Y E 
r a re 
| Smaak Count of Klant_ID 
Barbecue 414 
Burrito 414 
Cheese 414 
Chili 414 
| Guacamole 414 
Lightly Salted 414 
Salsa éi4 
Salted 414 
Total 414 
ke _— 
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4 Wijzig de kruisfilterrichting tussen de tabel Orders en de tabel Klanten naar Both. 


Figuur 33: kruisfilterrichting Both 
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Edit relationship 


Orders 


Source.Name Bestelnr 


< 
Klanten 
Klant_ID Bedrijfsnaam Klantnaam 
KO191 27 Prestige Saday Martin 
KO192 Agidra Bernard 
KO193 Agis Sas Dubois 

< 
Cardinality 

Many to one (*:1) 


si Make this relationship active 


Assume referential integrity 


Select tables and columns that are related. 


Besteldatum 
Orders_1017.csv 2017116 maandog2 oktober 2017 dinsdag 17 oktober 2017 64012914050 KO113 
Orders_1017.csv 2017116 moaandag2 oktober 2017 dinsdag 3loktober 2017 64012914050 K0113 
Orders_1017.csv 2017116 maandag 2 oktober 2017 zaterdag 14 oktober 2017 64012914050 KO113 


Klantvoornaam 


Jean 
Michel 
Philippe 


Verzenddatum 


Cross filter direction 


Taal_ID 


| Both 


| L| Apply security filter in both directions 


Productnr 
200104 
200105 
200106 

> 


Post_| 


True 49-51 Rue De Ponthieu 
True 5 Avenue De L'Escouvrier 


True 5 Avenue De L’Escouvrier 


Cancel 
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Figuur 34: kruisfilterrichting Both 


X 
Klanten oO Orders id 
Klant_ID EE] Besteldatum 
Adres Klantnr 
Bedrijfsnaam Productnr 
BTW-nummer | O ~ Verkoper 
Emailadres 1 se mi Verzenddatum 
Fax i > Bestelnr 
Geslacht > Paletten 
Klantnaam Source.Name ae 
Klantvoornaam Collapse A 


Collapse ~ 


5 Ga naar de rapportweergave om het resultaat te bekijken. 


Figuur 35: aantal klanten per smaak 


r rhe E 
Smaak Count of Klant_ID 
Barbecue = 7 154 
Burrito 147 
Cheese 165 
Chili 157 

| Guacamole 159 Í 
Lightly Saited 145 
Salsa 163 
Salted 126 
Total 414 

L- ia _wj 


Het resultaat is het correcte aantal klanten per smaak. 


Notitie 


Door de kruisfilterrichting te wijzigen kun je mogelijke problemen met visualisaties oplossen. We raden het 
niet aan, omdat het wijzigen van de kruisfilterrichting naar ‘Both’ negatieve gevolgen heeft voor de perfor- 
mantie van het model. 


Betere oplossingen zijn het gegevensmodel wijzigen of gebruikmaken van de DAX-functie CROSSFILTER. 


138 


Business analytics met Power BI_2021.indb 138 ® 9/08/21 09:36 


